新型冠状病毒(2019-nCoV)感染所致肺炎(以下简称新冠肺炎)疫情来势汹汹,新冠肺炎患者确诊和疑似筛查已经成为疫情控制的重要工作之一,基于医学影像(如肺部CT)的影像检查方法,已经成为PCR(聚合酶链式反应)检测试剂盒检测的重要补充。结合人工智能技术,能更快速、高效的开展新冠患者的筛查和诊疗工作;针对新型冠状病毒的新药研发也正在加紧运行,《柳叶刀》的最新研究就展示了利用人工智能筛选出的上市药物巴瑞替尼,可能对新冠病毒感染有效。接下来,研究者准备进行临床试验来验证其效果。除了生物及医学领域的研究人员,可以说人工智能也加入了新冠患者的筛查和新药筛选的科研大军中。医疗过程中主要产生如下表所示的两大类、四种数据。这些数据除了具有大数据的5V特性——数据容量大、数据结构多样、增长速度快、数据价值大和真实性,还具有以下独有的性质。
隐私性:医疗数据主要来自复杂的“人”,不可避免地涉及人的隐私信息。隐私信息的非法使用会带来安全性和机密性问题,如近些年来频发的妇产信息泄露事件和人群健康数据泄密事件。不完整性:医疗数据的搜集和处理过程经常脱节,现有的数据搜集往往以医治患者为目的,而处理可能面向多种应用,如研究某种疾病的一般规律等。收集的数据无法涵盖应用所需数据的情况时有发生。另外,数据的不一致性、表达的不确定性和模糊性使得医疗数据不能支撑所有的应用。冗余性:同样的数据多次出现的现象在医疗过程中经常出现,如患有同一疾病的患者所表现的症状、检查和检验结果、治疗过程可能完全一致,同一个人多次的体检结果可能完全一样。此外,医疗数据中无关紧要的、甚至相互矛盾的情况普遍存在。长期性:医疗大数据覆盖人的整个生命周期,具有很强的时间特性。历史数据成为医生对患者进行诊疗时考虑的关键因素之一。按照医疗行业规定,门急诊数据至少需保存15年,住院数据需保存30年,影像数据需无限期保存。伦理性:医疗的服务对象是“人”,遵守伦理规范是数据采集和利用的底线。目前,人工智能技术在医疗过程中的主要应用领域包括智能诊疗、医疗机器人和健康管理等。智能诊疗的主要任务是利用患者院内数据(特别是住院数据)进行智能化诊疗。当前研究比较多的两个分支是基于医学图形和图像分析的辅助诊断和基于电子病历分析的智能诊疗。其中,基于电子病历分析的智能诊断包括用药预测、住院期间的死亡风险预测、非预期再住院风险预测、住院天数预测和出院疾病诊断预测等。在实际应用中,把这些问题转化成分类、聚类或者回归问题进行处理。传统的方法有决策树、随机森林、支持向量机、K均值聚类、逻辑回归等。近年来,随着深度学习的发展,大部分诊疗任务在深度学习框架下得到了很好的统一。正如文献(Esteva, et al., 2019)中所描述的那样,上表所述的各种数据均可统一在下图所示的框架下。
一些常用的网络如卷积神经网络、循环神经网络和一些经典算法如强化学习均被广泛应用于各种诊疗任务中。另外,医疗领域的知识图谱在智能治疗过程中一直占据着重要位置,也是目前普遍可接受的方式。医疗机器人是用于医院、诊所的医疗或辅助医疗的智能型服务机器人。
一般认为,医疗机器人属于医疗器械,不同于聊天机器人之类的纯软件机器人。医疗机器人的智能性体现在能根据实际医疗需求独自编制操作计划、生成动作程序并加以实施。根据国际机器人联合会(International Federation ofRobotics,IFR)的分类体系,医疗机器人可以分为手术机器人、康复机器人、辅助机器人和服务机器人4大类。医疗机器人的优势在于效率高、创伤小、操作精准和稳定性强。手术机器人是一种智能化的手术平台,广泛应用于多个科室,如泌尿外科的前列腺切除术、肾移植、输尿管成形术等,妇产科的子宫切除术、输卵管结扎术等,普通外科的胆囊切除术等,在医疗机器人体系中占比最高。康复机器人是一种通过取代或者协助人体的某些功能,在康复医疗过程中发挥作用的机器人,主要包括康复机械手、医院机器人系统、智能轮椅、假肢和康复治疗机器人等。每一类型的康复机器人均有较为成熟的产品面世。辅助机器人是一种可以感知,并能通过处理感知信息,给予用户反馈操作的医疗机器人,主要用于满足行动不便或者老年群体对医护的需求。服务机器人是一种帮助医护人员分担一些沉重、烦琐的运输和基础工作的机器人,如医用运输机器人、杀菌机器人等。健康管理是指对个人或人群的健康危险因素进行全面管理的过程,其宗旨是调动个人及集体的积极性,有效地利用有限的资源达到最大的健康效果。健康管理的概念最先由美国在20世纪50年代末提出,其核心内容是医疗保险机构通过对其医疗保险客户(包括疾病患者或高危人群)开展系统的健康管理,有效控制疾病的发生或发展,显著降低出险概率和实际医疗支出,从而减少医疗保险赔付损失。利用人工智能技术提高健康管理质量和效果一直是智慧医疗关注的重点之一。智能健康主要包括健康危险因素监测、分析、评估和干预的全面管理过程。健康管理涉及的范围较广,在此不再详细展开介绍。
人工智能时代,医学研究正从以实验驱动的方式转化为以数据驱动的方式。
传统研究方式vs.人工智能时代数据驱动的研究方式
上图中对这两种方式进行了比较。传统的医学研究从提出假设开始,然后设计实验进行验证,最后分析实验结果得出结论。数据驱动的医学研究在提出假设、设计实验和结果分析的每一部分均可以依赖数据,尤其是提出假设部分。此外,有些研究甚至可以直接通过人工智能模型来完成。药物研发是人工智能在医疗研究领域的一个重要应用。药物研发一般可以分为三个阶段:临床前研究、临床试验和上市后跟踪。
临床前研究,首先根据化学或生物学的药物设计经验理论,通过偶然的发现或受现有临床经验的启发等方式,确立研发靶标及新药物实体的来源方案;然后,合成化合物并进行药理学、药代动力学、毒理学和处方研究。临床试验主要通过人体临床试验验证药物的安全性、有效性和剂量。上市后跟踪主要通过IV期临床研究来理解药物的作用机理和范围,发现药物可能的疗效,补充新的剂量规格及挖掘上市后的药物副作用(Adverse Drug Reaction,ADR)。据相关数据统计,药物研发临床前研究成功率不到0.1%,进入临床试验的药物,仅有10%左右能够最终上市销售。因此,药物研发周期长、成本高、成功率低。随着医药大数据的发展,为提高药物研发效率,人工智能技术逐渐被引入药物研发的每一个阶段。如在临床前研究阶段,通过文本分析技术从医学文献中挖掘可能的药物靶点,通过机器学习算法分析药物分子结构,筛选化合物;在临床实验阶段,通过电子病历分析技术自动构建病人队列;在上市后,通过电子病历分析和多媒体数据分析等技术发掘药物副作用。除了药物研发,人工智能技术也用于临床疗效对比分析、病因学研究等多个方面。
随着物联网、云计算、大数据和人工智能等技术的蓬勃发展,智慧医疗迎来了前所未有的发展机遇。相信在不久的将来,智慧医疗会深刻改变医疗的流程和效率,人工智能会推动医疗领域向着智能化、日常化和人性化的方向发展。对就医者来讲,由于信息获取更加便捷,与医护人员和医疗服务机构连接更加容易,自主参与医疗过程的意愿和需求将越来越强烈,围绕个人健康管理的技术和应用系统将成为现有医疗体系的自然延伸。个人健康管理系统通过对院外行为的管理,将大大改善就医者的安全性和服从性,提高慢性病的治疗和管理效果。就医生而言,一方面,通过智能辅助决策系统能够快速定位与医疗决策相关的多方面的知识,做出更加合理的诊疗决策,降低诊疗风险,一些烦琐、重复的简单操作将逐步被机器替代;另一方面,数据驱动的医学研究将逐步成为医学研究的主要方式,加快医学研究的进度。就医疗机构而言,利用物联网、云计算、大数据和人工智能等相关技术对医疗过程中的每一个环节进行升级、改造、甚至流程再造,是很长一段时间内需要重点关注的方向,也是“智慧医疗”的核心,如基于辅助诊断的分级诊疗、多科室远程会诊、多医院远程会诊等。就公共卫生而言,以“上报”为主的防治方式将逐步转变成以主动“采集”为主的预防方式。“采集”是通过数据分析和挖掘完成的,数据的来源将从单一的院内数据扩展到包括社交网络数据、消费数据等在内的多种数据。大众的医学教育也将逐步常规化和个性化。尽管智慧医疗具有广阔的应用前景,但我们应该清醒地认识到现在及未来可能遇到的挑战,主要体现在以下几个方面。(1)数据是智慧医疗发展的基础,现有医疗数据的互联互通仍是一个很大的问题,数据质量亦参差不齐,严重阻碍了人工智能技术在医疗领域的应用。(2)医疗领域对精度的要求苛刻,目前人工智能技术仅在一些特定的领域和业务上(如基于医学图像处理的肺结节识别和皮肤癌诊断等)取得了较好的成果,仍局限于感知智能。在需要复杂推理的认知智能方面仍未获得突破。(3)医疗领域数据的多样性、复杂性和特殊性,给相关技术,特别是人工智能技术,提出了更高的要求。智慧医疗的发展首先依赖人工智能技术本身的持续发展。(4)智慧医疗是医疗发展的新阶段,必将产生大量新的模式,伴随而来的是社会、伦理和法律方面的挑战。数据如何使用?技术如何在医疗过程中发挥作用?均需要在不断的摸索过程中建立其规范、合理、有序的法律法规和标准。(5)与其他领域相比,医疗领域的相关人才尤其匮乏。建立完整的人才培养体系也是智慧医疗长期稳定发展的前提。总之,智慧医疗是信息技术在医疗领域中应用的结晶,是一个长远的追求目标,短时间内不会彻底改变传统的医疗方式,更不会完全取代医生。一种负责任的观点是:主动拥抱新技术,尽可能地发挥现有信息技术的作用,提高医疗每个环节的效率和质量,逐步实现对医疗服务的升级和改造。大数据是实现人工智能的重要支持,大数据智能的实现,一方面得益于计算能力突飞猛进,另一方面,则得益于计算框架的返璞归真。当社会大数据、计算能力和计算框架三方面发展到一定阶段,融合产生了大数据智能。相信随着更大规模数据、更强计算能力和更合理计算框架的推出,人工智能也会不断向前发展。《大数据智能:数据驱动的自然语言处理技术》这本书就是这样一本介绍大数据智能分析技术的科普书籍,旨在让更多人了解和学习互联网时代的自然语言处理技术,让大数据智能技术更好地为我们服务。
扫码获取本书详情
▊ 豪华作者团队
本书适合作为高等院校计算机相关专业研究生的学习参考资料,也适合计算机技术爱好者,特别是希望对大数据技术有所了解,想要将大数据技术应用于本职工作的所有读者阅读。
博文视点学院1元好课推荐
知识图谱是实现机器认知智能的基础,也是一门应用广泛的工程学科。其具体方法大都来自计算机或人工智能的其他领域,比如自然语言处理、机器学习、知识工程等。面对如此庞杂的知识,应该如何着手学习?现在扫描下方二维码,仅需1元!《知识图谱:概念与技术》一书作者之一、复旦大学大数据学院与大数据研究院副院长阳德青老师,将为你带来一堂入门课。
(扫码报名)
假期不停学,弯道好超车